\section{最小多项式}

\begin{frame}{本节概要}
  \begin{enumerate}
    \item 我们知道一个线性变换 (或方阵) 的特征多项式能零化该线性变换 (该矩阵)。
      在能零化一个线性变换 (或方阵) 的多项式中有个次数最低的首一多项式就是最小多项式。
      最小多项式是唯一的，且所有零化的多项式都能被最小多项式整除。
      另外，最小多项式与特征多项式有相同的根集；相似矩阵有相同的最小多项式。
    \item 我们将得到用最小多项式刻画可对角化的条件：一个矩阵可对角化当且仅当
      其最小多项式为互异的首一一次因子的乘积。在复数域上，这也相当于说最小多项式没有重根。
    %\item 证明的一个关键点在于：
    %  我们当初用的是特征多项式的标准分解中一次因子的幂 (称为准素因子) 来定义根子空间，
    %  实际上根子空间也可用最小多项式的标准分解中一次因子的幂 (准素因子) 来描述。
  \end{enumerate}
\end{frame}


\begin{frame}{最小多项式}

根据哈密顿-凯莱定理，任给数域 $P$ 上一个 $n$ 阶矩阵 $ A$, 总可找到数域 $P$ 上一个多项式 $f(x)$, 使 $f( A)= 0$. 
如果多项式 $f(x)$ 使 $f( A)= 0$, 
我们就称$f$ \emph{零化} (annihilate) $A$, 或 $f(x)$ 以 $ A$ 为\emph{根}，或$f$为$A$的\emph{零化多项式} (annihilating polynomial)。
当然， $A$的零化多项式是很多的， 其中次数最低的首一的零化多项式称为 $A$的\emph{最小多项式} (minimal polynomial)。 这一节讨论如何应用最小多项式来判断一个矩阵可否对角化的问题。

首先介绍最小多项式的一些基本性质。

\begin{theorem}
矩阵 $A$ 的最小多项式是唯一的。
\end{theorem}
\begin{proof}
设 $g_{1}(x)$ 和 $g_{2}(x)$ 都是 $ A$ 的最小多项式，根据带余除法， $g_{1}(x)$ 可表成
\[
g_{1}(x)=q(x) g_{2}(x)+r(x),
\]
其中 $r(x)=0$ 或 $\partial(r(x))<\partial\left(g_{2}(x)\right)$,于是
\[
g_{1}( A)=q( A) g_{2}( A)+r( A)= O,
\]
因此 $r( A)= O$. 由最小多项式的定义， $r(x)=0$, 即 $g_{2}(x) \mid g_{1}(x)$. 同样可证 $g_{1}(x) \mid g_{2}(x)$.因此 $g_{1}(x)$ 与 $g_{2}(x)$ 只能相差一个非零常数因子。 又因 $g_{1}(x)$ 与 $g_{2}(x)$ 的首项系数都等于 1 , 所以 $g_{1}(x)=g_{2}(x)$. 
\end{proof}

\end{frame}

\begin{frame}
  \begin{example}
  数量矩阵 $k  E$ 的最小多项式为 $x-k$, 特别地， 单位矩阵的最小多项式为 $x-1$, 零矩阵的最小多项式为 $x$.
另一方面，如果 $A$ 的最小多项式是 $1$ 次多项式，那么 $A$ 是数量矩阵。
\end{example}

\begin{example}
考虑
\[
  A=\begin{pmatrix}
    1 & 1 & \\
  & 1 & \\
& & 1
\end{pmatrix},
\]
因为 $A$ 的特征多项式为
\[
|x  E- A|=(x-1)^{3},
\]
所以 $ A$ 的最小多项式为 $(x-1)^{3}$ 的因式。 显然， $ A- E \neq  O$ 而 $( A- E)^{2}= O$, 
因此 $ A$ 的最小多项式为 $(x-1)^{2}$.
\end{example}

应用跟上述定理同样的证明方法， 可证下述引理。
\begin{theorem}
  设 $m(x)$ 是矩阵 $ A$ 的最小多项式，那么 $f(A)=0$当且仅当 $m\mid f$.%
  \footnote{令$A$的多项式构成的环为$P[A]$. 
    显然有满同态$\varphi\colon P[x]\rightarrow P[A], f(x)\mapsto f(A)$.
    由此定理知$\ker \varphi=(m(x))$. 故$P[A]\cong P[x]/(m(x))$.
  }
\end{theorem}


\end{frame}

\begin{frame}


由此可知，矩阵 $A$ 的最小多项式是 $A$ 的特征多项式的一个因式。
不仅如此

\begin{lemma}\label{16F}
  最小多项式与特征多项式有相同的根集。
\end{lemma}
特别地，若多项式$f$零化$A$, 那么$A$的特征值都是$f$的根，因为$A$的最小多项式整除$f$.

\begin{proof}
  令$m(\lambda), p(\lambda)$分别为方阵$A$的最小多项式与特征多项式。
  $m(\lambda) \mid p(\lambda)$表明$m(\lambda)$的根是 $p(\lambda)$的根。
  反过来，令$\lambda_0\in P$为$p(\lambda)$的根。若$m(\lambda_0)\neq 0$, 则
  $m(\lambda)$与$\lambda-\lambda_0$互素，存在$u, v\in P[\lambda]$使得
  \[
    u(\lambda)m(\lambda)+v(\lambda)(\lambda-\lambda_0)=1.
  \]
  令$\lambda=A$得
  \(
    v(A)(A-\lambda_0 E)=E.
  \)
  这表明$A-\lambda_0 E$可逆。但$\lambda_0$是$A$的特征值蕴含了$A-\lambda_0 E$不可逆，矛盾了。这就证明了$p(\lambda)$的根都是$m(\lambda)$的根。
\end{proof}
\begin{exercise}\label{15D}
  方阵$A$称为\emph{幂零}，如对某个正整数$k$有$A^k=0$.
  对 $A\in \bC^{n\times n}$, 证明下列等价：\\
  (1) $A$ 幂零；\\
  (2) $A$ 所有特征值都是$0$;\\
  (3) $A$ 的特征多项式为 $p(\lambda)=\lambda^n$; \\
  (4) $\tr A^k=0$, 对 $k=1, \cdots, n$.
\end{exercise}
%\hint (4)$\Rightarrow$(3)的推导如下。设$A$的$n$个特征值为$\lambda_1,\cdots,\lambda_n$. $k=1,\cdots,n$时 $\tr A^k=0$表明$\sum_{i=1}^n \lambda_i^k=0$. 

\end{frame}

\begin{frame}%{相似的方阵有相同的最小多项式}

  \begin{observation*}
    相似矩阵有相同的最小多项式。
  \end{observation*}
  \begin{proof}
  如果矩阵 $ A$ 与 $ B$ 相似， 比如 $ B= T^{-1}  A  T$, 那么对任一多项式 $f(x), f( B)= T^{-1} f( A)  T$. 
因此 $f( B)= O$ 当且仅当 $f( A)= O$. 
\end{proof}
  但是需要注意，这个条件并不是充分的，即最小多项式相同的矩阵不一定是相似的。下面的例子说明这个结论。
\begin{nonexample}
设
\[
   A=\begin{pmatrix}
    1 & 1 & & \\
  & 1 & & \\
& & 1 & \\
& & & 2
\end{pmatrix}, \quad  B=\begin{pmatrix}
  1 & 1 & & \\
& 1 & & \\
& & 2 & \\
& & & 2
\end{pmatrix} .
\]
$ A$ 与 $ B$ 的最小多项式都等于 $(x-1)^{2}(x-2)$, 但是它们的特征多项式不同，因此 $ A$ 和 $ B$不是相似的。
(由于最小多项式与特征多项式有相同的根集，可从 $(x-1)(x-2)$ 这个特征多项式的因子试起；
或者应用下面的引理~\ref{128}。)
\end{nonexample}


\end{frame}

\begin{frame}{最小多项式与可对角化}%{准对角阵的最小多项式}

为了讨论矩阵可对角化的问题，还需要用到下面的引理。
\begin{lemma}\label{128}
设 
\[
  A=\begin{pmatrix}
     A_{1} & \\
&  A_{2}
\end{pmatrix}
\]
是一个准对角矩阵，
并设 $ A_{1},A_2$ 的最小多项式分别为 $g_{1},g_2$, 那么 $ A$ 的最小多项式为 $g_{1},g_{2}$ 的首一最小公倍式 $\left[g_{1}, g_{2}\right]$. 
一般地，如果
\[
  A=\begin{pmatrix}
     A_{1} & \\
     &\ddots\\
&  &  A_{s}
\end{pmatrix},
\]
且每个$ A_{i}$ 的最小多项式为 $g_{i}$, 那么 $ A$ 的最小多项式为 $\left[g_{1}, g_{2}, \cdots, g_{s}\right]$.
\end{lemma}
\end{frame}

\begin{frame}
  \begin{proof}
    记 $g=\left[g_{1}, \cdots, g_{s}\right]$. 
    首先
\[
  g( A)=\begin{pmatrix}
    g\left( A_{1}\right) & \\
    & \ddots \\
&  & g\left( A_{s}\right)
\end{pmatrix}= 0,
\]
因此 $g$ 能被 $ A$ 的最小多项式整除。 其次， 如果多项式$h$满足 $h( A)= 0$, 那么
\[
  0= h( A)=\begin{pmatrix}
    h\left( A_{1}\right) & \\
    & \ddots \\
&  & h\left(A_{s}\right)
\end{pmatrix},
\]
所以 $h\left( A_{1}\right)= 0,\cdots, h\left( A_{s}\right)= 0$, 
因而 $g_{1}\mid h, \cdots,g_{s}\mid h$; 由此得 $g \mid h$. 
这样就证明了 $g$ 是 $ A$ 的最小多项式。 
\end{proof}


\end{frame}

\begin{frame}%{Jordan块的最小多项式}
  \begin{lemma}
  Jordan 块
  $J(a, k)=
    \begin{pmatrix}
      a & & & \\
    1 & \ddots & & \\
  & \ddots & a & \\
& & 1 & a
\end{pmatrix}
$
的最小多项式为 $(x-a)^{k}$.
\end{lemma}
\begin{proof}
$ J=J(a, k)$ 的特征多项式为 $(x-a)^{k}$, 而
\[
  \begin{aligned}
     J-a  E =\begin{pmatrix}
      0 & & & \\
    1 & \ddots & & \\
  & \ddots & 0 & \\
& & 1 & 0
\end{pmatrix}, \qquad
( J-a  E)^{k-1} =\begin{pmatrix}
  0 & & & \\
\vdots &\ddots & & \\
0 & & \ddots& \\
1 & 0 & \cdots & 0
\end{pmatrix} \neq  0,
\end{aligned}
\]
所以 $ J$ 的最小多项式为 $(x-a)^{k}$. 
\end{proof}

\begin{exercise}
  $J(0, 3)\oplus J(0,2)\oplus J(1,1)\oplus J(1,2)\oplus J(1,3)\oplus J(2,4)$的最小多项式为？
\end{exercise}

\end{frame}

\begin{frame}%{可对角化的最小多项式刻画}


  \begin{theorem}\label{139}
    $ A\in P^{n\times n}$ 与对角矩阵相似的充分必要条件为 $ A$ 的最小多项式是 $P$ 上互素的一次因式的乘积。
\end{theorem}
\begin{corollary}
  复矩阵 $ A$ 与对角矩阵相似的充分必要条件是 $ A$ 的最小多项式没有重根。
\end{corollary}
\begin{proof*}[定理~\ref{139}~的证明]
由准对角方阵的最小多项式公式，条件的必要性是显然的。
现在证明充分性。

根据矩阵和线性变换之间的对应关系， 我们可定义任意线性变换 $\mathscr{A}$ 的最小多项
式， 它等于其对应矩阵 $ A$ 的最小多项式。 
我们只要证明， 若数域 $P$ 上某线性空间 $V$ 上的
线性变换 $\mathscr{A}$ 的最小多项式 $g(x)$ 是 $P$ 上互素的一次因式的乘积 $g(x)=\prod_{i=1}^{l}\left(x-a_{i}\right)$, 
则 $\mathscr{A}$有一组特征向量做成 $V$ 的基。

实际上， 由定理~\ref{16F}~知每个$a_i$都是$\sA$的特征值。
由于 $g(\mathscr{A}) V=\{\symbf{0}\}$, 
用引理~\ref{15F}~中同样步骤可证 $V=V_{1} \oplus \cdots \oplus V_{l}$, 
其中 $V_{i}=\ker(\sA-a_i\sE)$; 当然$V_i$就是属于特征值$a_i$的特征子空间。
既如此，合并这些$V_i$的基得到$V$的基时，$\sA$的矩阵是对角矩阵。
\end{proof*}

\begin{remark}
  也可和方阵的情形一样，定义一线性变换$\sA$ 的最小多项式为零化$\sA$的次数最小的首一多项式。
  这跟用$\sA$的矩阵定义的结果是一样的。
\end{remark}


\end{frame}

\begin{frame}

\begin{remark}\label{16E}
  把定理~\ref{15F}~中的特征多项式$f(\lambda)$换成任一零化多项式$g(\lambda)$都有类似的结果，
  且证明跟根子空间分解的证明完全一样。
  具体说来，若$g(A)=0$, 且$g(\lambda)=\prod_{i=1}^s (\lambda-\lambda_i)^{t_i}$为标准分解, 则
\[ 
  V=\bigoplus _{i=1}^s \ker (\sA-\lambda_i \sE)^{t_i}.
\]
注意到：若$\lambda_i$非$A$的特征值，则
$\ker (\sA-\lambda_i \sE)^{t_i}=\{0\}$, 因为 $(\sA-\lambda_i \sE)^{t_i}$是可逆的。 

特别地，  设$\mathscr{A}$ 的最小多项式 $m(\lambda)$的标准分解为
  $m(\lambda)=\prod_{i=1}^s (\lambda-\lambda_i)^{l_i}$.
  那么我们有 
  \[
    V=\bigoplus _{i=1}^s \ker (\sA-\lambda_i \sE)^{l_i}.
  \]
  因此，$\ker (\sA-\lambda_i \sE)^{l_i}$就是属于特征值$\lambda_i$的广义特征子空间。
\end{remark}

  \begin{exercise}
  设$A\in \bC^{n\times n}$满足$A^3=E$. $A$是否可对角化？
  再设$B\in \bC^{n\times n}$满足$B^5=E$且$A, B$可交换，$A+B$是否可对角化？
\end{exercise}

\end{frame}
